假设检验

概念

  • 第一类错误(拒真)
    • 概率为显著性水平,记为α\alpha
  • 第二类错误(存伪)
    • H0H_0为假时接受的概率为β\beta
    • H0H_0为假时拒绝的概率为检验的势,等于1β1-\beta
  • 当原假设为真时, 检验统计量的分布为零分布
  • 简单假设
    • 假设中的参数都是确定的
  • 在所有构造的统计量中,基于似然比的统计量有最大的势
    • 要求H0H_0HAH_A都是简单假设
    • 在同样的检验水平下
  • uniformly most powerful
    • HAH_A是复杂的,H1H_1相对于HAH_A中的每一个假设都是最优的,则H0H_0是一致最优的

公式

  • ω0\omega_0 为原假设的参数集合,ω1\omega_1是备择假设的参数集合,Ω=ω0ω1\Omega = \omega_0 \cup \omega_1,则2logA-2\log A的零分步服从自由度为dimΩdimω0\dim \Omega - \dim \omega_0的卡方分布
  • 例子
    • 多项分布的似然比检验
      • 注意自由度有和为1的约束
    • posisson散度检验
      • 由于EiE_i都一样,因此可以写成 T=nσ2xˉT = \frac{n\sigma^2}{\bar{x}}
    • 其统计量都一样(自由度不一样):
    • 2logA=2Oilog(OiEi)=(OiEi)2Ei-2\log A = 2\sum O_i\log (\frac{O_i}{E_i}) = \sum \frac{(O_i-E_i)^2}{E_i}

plot

悬挂根图

用估计的概率得到拟合值:nj^=npj^\hat{n_j} = n\hat{p_j}

可以发现,pj^\hat{p_j}较大的值含有较大的方差:var(njnj^)=npjvar (n_j - \hat{n_j}) = np_j

需要进行方差稳定性变换:

varY=σ2(μ)[f(μ)]2var Y = \sigma^2(\mu)[f'(\mu)]^2

因此,一般取njnj^\sqrt{n_j} - \sqrt{\hat{n_j}}

悬挂卡方图

njnj^nj^\frac{n_j - \hat{n_j}}{\sqrt{\hat{n_j}}}

数据汇总

概念

  1. 经验累计分布函数Fn(x)F_n(x)
    • 期望:E(Fn(x))=F(x)E(F_n(x)) = F(x)
    • 方差:1nF(x)(1F(x))\frac{1}{n}F(x)(1-F(x))
  2. 生存函数

    • Sn(t)=1Fn(t)S_n(t) = 1 - F_n(t)
  3. 危险函数

    • h(t)=f(t)1F(t)=ddtlogS(t)h(t) = \frac{f(t)}{1- F(t)} = -\frac{d}{d t}\log S(t)
  4. 核密度估计
    • 假设正太分布,则可以构造wh=1hw(xh)w_h = \frac{1}{h}w(\frac{x}{h})
    • 则概率密度函数ff 的估计为:fh(x)=1nwh(xXi)f_h(x) = \frac{1}{n} \sum w_h(x-X_i)
  5. 中位数
    • 样本中位数可以作为总体分位数的估计。构造一个中位数的置信区间:
      • (X(k),Xnk1)(X_{(k)},X_{n-k-1})
    • 可以计算这个区间的覆盖概率为:P(X(k)ηX(nk+1))=12P(ηX(k))P(X_{(k)} \le \eta \le X_{(n-k+1)}) = 1 - 2P(\eta\le X_(k))
    • 由于是否大于中位数都是1/2的概率,因此可使用二项分布:12nj=0k1Cnj=P(Yk1)\frac{1}{2^n}\sum\limits _{j=0}^{k-1} C_n^j = P(Y\le k-1)
  6. 截尾均值

    • 按照顺序排列数据,丢掉最小的100α\alpha%和最大的100α\alpha%,计算剩余数据的算术平均
  7. M估计

    • minΦ(Xiuσ)\min \sum \Phi (\frac{X_i - u}{\sigma})
  8. 散度度量

    • 最普通的度量为样本标准差S2S^2
    • 若观测时来自正太分布的样本,则:(n1)s2σ2χn12\frac{(n-1)s^2}{\sigma^2} \sim \chi ^2_{n-1}
    • 但样本标准差对离群观测比较敏感
    • 四分位差(IQR)(25%与75%分位数的差值)
    • 中位数绝对偏差(xix^|x_i - \hat{x}|的中位数)(MAD)
    • 可以将其转为正太分布的σ\sigma 估计:

      • IQR1.35=MAD0.675=σ\frac{IQR}{1.35} = \frac{MAD}{0.675} = \sigma
  9. 皮尔逊相关系数
    • r=cov(X,Y)σ(X)σ(Y)=(xixˉ)(yiy)ˉ)(xixˉ)2(yiyˉ)2r = \frac{cov (X,Y)}{\sigma(X)\sigma(Y)} = \frac{\sum(x_i-\bar{x})(y_i-\bar{y)})}{\sqrt{\sum(x_i - \bar{x})^2\sum(y_i - \bar{y})^2}}
    • 注意,这个系数只能衡量线性关系

两样本比较

两独立样本比较

基于正态的方法

需要假设X/YX/Y都服从正态分布且方差相等,这里只是检验其均值是否有差异

XˉYˉN(μxμy,σ2(1n+1m))\bar{X} - \bar{Y} \sim N(\mu_x-\mu_y,\sigma^2(\frac{1}{n }+ \frac{1}{m}))

  1. σ\sigma已知,则可以构造μxμy\mu_x - \mu_y 的置信区间:
    • (XˉYˉ)±z(α/2)σ1n+1m(\bar{X} - \bar{Y}) \pm z(\alpha/2) \sigma\sqrt{\frac{1}{n}+ \frac{1}{m}}
  2. 更一般的,σ\sigma未知时,
    • 计算合并样本方差:sp2=(n1)sx2+(m1)xy2m+n2s_p^2 = \frac{(n-1)s_x^2 + (m-1)x_y^2} {m+n-2}
    • 构造tt 统计量(自由度为m+n2m+n-2 ):t=(XˉYˉ)(μxμy)sp1n+1mt = \frac{(\bar{X} -\bar{Y})- (\mu_x -\mu_y)}{s_p\sqrt{\frac{1}{n} + \frac{1}{m}}}
    • XˉYˉ\bar{X} - \bar{Y}的估计标准差为:sXˉYˉ=sp1n+1ms_{\bar{X} - \bar{Y}} = s_p\sqrt{\frac{1}{n} + \frac{1}{m}}
  3. 此时,构造μxμy\mu_x - \mu_y 的置信区间:
    • (XˉYˉ)±t(α/2)sXˉYˉ(\bar{X} - \bar{Y}) \pm t(\alpha/2)s_{\bar{X} - \bar{Y}}
  4. 可以证明,这种tt检验与基于似然比的检验等价

势是拒绝假的概率,可以用来确定样本容量的大小

若设备则假设为μXμY=Δ\mu_X -\mu_Y = \Delta,则对于原假设μX=μy\mu_X = \mu_y的拒绝域为:

XˉYˉ>z(α/2)σ2n|\bar{X} - \bar{Y}| > z(\alpha/2)\sigma\sqrt{\frac{2}{n}}

对备则假设进行标准化后,可以得到落入拒绝域的概率为:

1Θ[z(α/2)Δσn2]+Θ[z(α/2)Δσn2]1-\Theta[z(\alpha/2) - \frac{\Delta}{\sigma}\sqrt{\frac{n}{2}}] + \Theta[-z(\alpha/2) - \frac{\Delta}{\sigma}\sqrt{\frac{n}{2}}]

非参数检验(Mann-Whitney Test)

问题

x1xnx_1…x_ny1...ymy_1...y_m 表示处理1和处理2的观测值,要比较X和Y的分布是否相同

原假设是完全随机(没有效应),当控制组观测的秩和太大或太小时,拒绝原假设。

操作流程:

  1. 若有m+nm+n 个实验单元,随机分成实验组和控制组
  2. 计算控制组的秩,并根据秩和进行判断

在原假设成立下,我们可以计算控制组秩和的统计量为:

  • E(TY)=mμ=m(m+n+1)2E(T_Y) = m\mu = \frac{m(m+n+1)}{2}
  • Var(TY)=mσ2(NmN1)=mn(m+n+1)12Var(T_Y) = m\sigma^2(\frac{N-m}{N-1}) = \frac{mn(m+n+1)}{12} (不放回的抽样)

同时,可以计算X<YX<Y的个数的统计量UY=TYm(m+1)2U_Y= T_Y - \frac{m(m+1)}{2}

  • E(UY)=mn2E(U_Y) = \frac{mn}{2}
  • Var(UY)=mn(m+n+1)12Var(U_Y) = \frac{mn(m+n+1)}{12}

在m和n大于10的时候可以用正态近似,否则需要查表

配对样本比较

基于正态的方法

在方差已知的情况下:

E(Dˉ)=μXμYE(\bar{D}) = \mu_X - \mu_Y

Var(Dˉ)=1nσX2+σY22ρσXσYVar(\bar{D}) = \frac{1}{n}{\sigma^2_X + \sigma^2_Y - 2\rho\sigma_X\sigma_Y}

更一般的,在方差未知的情况下,用样本方差代替总体方差,可得到统计量为:

t=DˉμDsDˉt(n1)t = \frac{\bar{D} - \mu_D}{s_{\bar{D}}}\sim t(n-1)

其中,sDˉs_{\bar{D}}为样本差的样本方差,即sXY/ns_{X-Y}/\sqrt{n}

符号秩检验

若两个配对样本没有差别,那么可以预计一般的DD是正的,一般的DD是负的

计算步骤:

  1. 计算差DD,差的绝对值
  2. 将差的符号用在秩上,得到符号秩
  3. 计算具有正的符号的秩W+W_+

W+W_+ 太大或太小,则拒绝原假设

若样本容量超过20,可以用正态近似:

  • E(W+)=n(n+1)4E(W_+) = \frac{n(n+1)}{4}

  • Var(W+)=n(n+1)(2n+1)24Var(W_+) = \frac{n(n+1)(2n+1)}{24}

results matching ""

    No results matching ""